A. ECHELLE REGIONALE (Cours)
Fonds de carte
Données
| Tableau de données |
| code |
nom |
Aubry |
Bardella |
Bellamy |
Deffontaines |
Glucksman |
Hayer |
Lassale |
Marechal |
Toussaint |
Autres |
| 44 |
ACAL |
7.6 |
38.3 |
7.6 |
1.6 |
10.8 |
14.4 |
1.9 |
5.5 |
4.1 |
8.2 |
| 75 |
AQUI |
6.8 |
30.9 |
6.5 |
2.9 |
16.0 |
14.8 |
4.7 |
5.0 |
5.3 |
7.2 |
| 84 |
AURA |
9.5 |
30.9 |
8.0 |
2.3 |
13.8 |
14.2 |
2.1 |
5.6 |
6.2 |
7.4 |
| 27 |
BOFC |
7.0 |
37.1 |
7.5 |
2.3 |
12.2 |
13.8 |
2.9 |
5.3 |
4.4 |
7.6 |
| 53 |
BRET |
7.1 |
25.6 |
7.5 |
2.6 |
18.4 |
17.4 |
2.3 |
4.2 |
7.3 |
7.6 |
| 24 |
CVDL |
7.4 |
34.9 |
7.5 |
2.6 |
12.5 |
15.1 |
2.6 |
5.4 |
4.4 |
7.5 |
| 11 |
IDF |
18.6 |
18.8 |
8.8 |
2.0 |
15.8 |
15.5 |
0.8 |
5.7 |
7.0 |
7.1 |
| 76 |
OCCI |
9.0 |
33.7 |
5.5 |
2.7 |
15.5 |
12.2 |
3.8 |
5.5 |
5.1 |
7.0 |
| 32 |
NOPI |
8.4 |
42.4 |
6.1 |
3.1 |
9.0 |
12.9 |
2.5 |
4.6 |
3.6 |
7.4 |
| 28 |
NORM |
6.9 |
35.3 |
6.9 |
2.8 |
13.3 |
15.7 |
2.7 |
4.6 |
4.4 |
7.3 |
| 52 |
PDL |
7.1 |
27.6 |
7.9 |
2.1 |
16.1 |
17.9 |
2.1 |
4.7 |
7.1 |
7.3 |
| 93 |
PACA |
9.7 |
38.6 |
6.4 |
2.1 |
10.5 |
12.3 |
1.5 |
7.7 |
4.2 |
6.9 |
Identification des voisins
Characteristics of weights list object:
Neighbour list object:
Number of regions: 12
Number of nonzero links: 46
Percentage nonzero weights: 31.94444
Average number of links: 3.833333
Link number distribution:
2 3 4 5 6
2 3 3 3 1
2 least connected regions:
BRET PACA with 2 links
1 most connected region:
CVDL with 6 links
Weights style: W
Weights constants summary:
n nn S0 S1 S2
W 12 144 12 6.643889 49.32222
Carte des voisinages
Choix d’une variable Y
On choisit une variable \(Y\) et on crée un fichier tab ne contenant que le code des régions cette variable. On crée une variable standardisée \(Y_{std}\)
| Tableau de données |
| code |
nom |
Y |
Y_std |
| 11 |
IDF |
18.8 |
−2.2 |
| 24 |
CVDL |
34.9 |
0.3 |
| 27 |
BOFC |
37.1 |
0.6 |
| 28 |
NORM |
35.3 |
0.4 |
| 32 |
NOPI |
42.4 |
1.5 |
| 44 |
ACAL |
38.3 |
0.8 |
| 52 |
PDL |
27.6 |
−0.8 |
| 53 |
BRET |
25.6 |
−1.1 |
| 75 |
AQUI |
30.9 |
−0.3 |
| 76 |
OCCI |
33.7 |
0.1 |
| 84 |
AURA |
30.9 |
−0.3 |
| 93 |
PACA |
38.6 |
0.9 |
Cartographie des valeurs brutes et standardisées
On cartographie la carte correspondante
Valeurs de voisinage
Pour une régon décrite par une variable \(Y\), la variable de voisinage \(Y_lag\) (Lagged variable) est la moyenne pondérée de Y dans les provinces voisines de i. Le calcul se fait donc très simplement en combinant les valeurs de Y et la matrice de voisinage pondéré que nous avons définie dans la section précédente.
| Valeurs standardisées et moyenne des voisins |
| code |
nom |
Y |
Y_std |
Y_lag |
Y_std_lag |
| 11 |
IDF |
18.8 |
−2.2 |
37.6 |
0.7 |
| 24 |
CVDL |
34.9 |
0.3 |
30.1 |
−0.4 |
| 27 |
BOFC |
37.1 |
0.6 |
30.7 |
−0.3 |
| 28 |
NORM |
35.3 |
0.4 |
29.9 |
−0.5 |
| 32 |
NOPI |
42.4 |
1.5 |
30.8 |
−0.3 |
| 44 |
ACAL |
38.3 |
0.8 |
32.8 |
0.0 |
| 52 |
PDL |
27.6 |
−0.8 |
31.7 |
−0.2 |
| 53 |
BRET |
25.6 |
−1.1 |
31.5 |
−0.2 |
| 75 |
AQUI |
30.9 |
−0.3 |
31.8 |
−0.2 |
| 76 |
OCCI |
33.7 |
0.1 |
33.5 |
0.1 |
| 84 |
AURA |
30.9 |
−0.3 |
35.1 |
0.3 |
| 93 |
PACA |
38.6 |
0.9 |
32.3 |
−0.1 |
Valeurs de voisinage
On peut vérifier que le calcul est juste en prenant l’exemple de la région BRET dont nous avons vu qu’elle n’a que deux voisins, PDL et NORM. Sa valeur moyenne de voisinage est donc :
\(Y_{lag}(BRET) = \frac{Y(PDL) + Y(NORM)}{2} = \frac{27.6 + 35.3}{2} = 31.5\)
Comme la valeur de \(Y\) pour la Bretagne est de 25.6 on peut dire que cette région vote moins pour Bardella que ses régions voisines.
Calcul et test de l’indice de Moran
L’indice de Moran, dans sa formulation la plus simple, n’est rien d’autre qu’une mesure de corrélation entre une variable \(Y\) et la variable de voisinage de voisinage \(Y_{lag}\) qui lui a été associée. On peut de mesurer ce coefficient à l’aide du coefficient de corrélation \(r(Y,Y_{lag}\) :
Pearson's product-moment correlation
data: sel$Y and sel$Y_lag
t = -2.4589, df = 10, p-value = 0.03374
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.87832366 -0.06166422
sample estimates:
cor
-0.6138424
Le coefficient d’autocorrélation spatiale de Moran serait donc ici égal à +0.61 et le test de significativité semble significatif (p < 0.05)
Calcul et test de l’indice de Moran
Mais en pratique la plupart des auteurs prfèrent que le coefficient de Moran soit mesuré non pas par le coefficient de corrélation mais par le coefficient \(a\) de la pente de la droite de régression \(Y_{lag} = a.Y + b\) :
Call:
lm(formula = sel$Y_lag ~ sel$Y)
Residuals:
Min 1Q Median 3Q Max
-2.35099 -1.72057 -0.09556 1.41752 2.37313
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 39.1643 2.8364 13.808 7.73e-08 ***
sel$Y -0.2085 0.0848 -2.459 0.0337 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 1.837 on 10 degrees of freedom
Multiple R-squared: 0.3768, Adjusted R-squared: 0.3145
F-statistic: 6.046 on 1 and 10 DF, p-value: 0.03374
Le coefficient d’autocorrélation spatiale de Moran est donc ici égal à -0.208 ce qui est la réponse donnée par la fonction moran.test()du package spdep ou la fonction moran_test() du package rgeoda. Cela est de toutes façons équivalent et on peut vérifier que la mesure de significativité de la régression est la même que celle du coefficient de corrélation (p < 0.05)
Calcul et test de l’indice de Moran
Les travaux de nombreux auteurs, et notamment Luc Anselin, ont proposé des améliorations au calcul de l’indice de Moran, notamment en présence de distributions Y de formes non gaussienne. L’usage du coefficient de corrélation linéaire suppose en effet que Y et Y_lag respectent des contraintes de normalité qui sont rarement vérifiées. Il vaut donc mieux dans ce cas recourir à des méthodes de simulation de type Monte Carlo pour obtenir un test réellement robuste. Ces méthodes sont toutefois gourmandes en temps de calcul et on ne les employera pas forcément sur les très grands tableaux. Les différentes variantes de calcul de l’indice de Moran sont facilement accessibles dans spdep grâce à la fonction moran.test().
Moran I test under randomisation
data: sel$Y
weights: map_nb_w
Moran I statistic standard deviate = -0.69097, p-value = 0.4896
alternative hypothesis: two.sided
sample estimates:
Moran I statistic Expectation Variance
-0.20852369 -0.09090909 0.02897351
On retrouve bien notre coefficient de -0.208 mais le test ici n’est pas concluant et on ne peut donc pas affirmer que la configuration observée ne soit pas l’effet du hasard.
Construction et interprétation d’un diagramme de Moran
On peut visualiser la relation statistique à l’aide d’un diagramme de Moran qui croise la variable standardisée \(Y_{std}\) et la moyenne dans le voisinage de cette variable standardisée \(Y_{std}^{lag}\)
Indices locaux (LISA)
On peut finalement analyser pour chaque unité spatiale les cas exceptionnels à l’aide des indices locaux d’autocorrelation spatiale appelés en anglais LISA (Local Index of Spatial Autocorrelation)
| Indices locaux d’autocorrélation spatiale |
| code |
nom |
Y |
Y_std |
Y_lag |
Y_std_lag |
Ii |
E.Ii |
Var.Ii |
Z.Ii |
Pr.z....E.Ii.. |
| 11 |
IDF |
18.79 |
−2.15 |
37.62 |
0.73 |
−1.71 |
−0.46 |
0.36 |
−2.09 |
0.04 |
| 24 |
CVDL |
34.94 |
0.32 |
30.12 |
−0.42 |
−0.15 |
−0.01 |
0.01 |
−1.36 |
0.17 |
| 27 |
BOFC |
37.09 |
0.65 |
30.74 |
−0.32 |
−0.23 |
−0.04 |
0.08 |
−0.65 |
0.52 |
| 28 |
NORM |
35.33 |
0.38 |
29.87 |
−0.46 |
−0.19 |
−0.01 |
0.02 |
−1.23 |
0.22 |
| 32 |
NOPI |
42.41 |
1.46 |
30.82 |
−0.31 |
−0.50 |
−0.21 |
0.53 |
−0.39 |
0.70 |
| 44 |
ACAL |
38.33 |
0.84 |
32.76 |
−0.01 |
−0.01 |
−0.07 |
0.21 |
0.12 |
0.90 |
| 52 |
PDL |
27.63 |
−0.80 |
31.70 |
−0.18 |
0.16 |
−0.06 |
0.12 |
0.62 |
0.54 |
| 53 |
BRET |
25.58 |
−1.11 |
31.48 |
−0.21 |
0.26 |
−0.12 |
0.58 |
0.50 |
0.62 |
| 75 |
AQUI |
30.94 |
−0.29 |
31.79 |
−0.16 |
0.05 |
−0.01 |
0.02 |
0.46 |
0.65 |
| 76 |
OCCI |
33.69 |
0.13 |
33.50 |
0.10 |
0.01 |
0.00 |
0.01 |
0.21 |
0.83 |
| 84 |
AURA |
30.91 |
−0.30 |
35.06 |
0.34 |
−0.11 |
−0.01 |
0.01 |
−0.90 |
0.37 |
| 93 |
PACA |
38.65 |
0.89 |
32.30 |
−0.09 |
−0.08 |
−0.08 |
0.39 |
−0.01 |
0.99 |
Indices locaux (LISA)
- La variable Ii est l’indice d’autocorrélation spatiale local de la région. Il peut être localement plus fort ou plus faible que l’indice global qui a été mesuré sur l’ensemble des provinces italiennes. Il est directement lié à la position dans les quadrants du diagramme de Moran : l’indice sera positif pour les provinces de type Low-Low ou High-High mais négatif pour les provinces de type Low-High ou High-Low.
- la variable E.Ii est l’espérance de l’indice local d’autocorrélation spatiale, c’est-à-dire la valeur attendue en l’absence d’autocorrélation spatiale positive ou négative.
- la variance var.Ii est une mesure de la stabilité des différences observées entre une province et ses voisines. Si par exemple une province a une valeur deux fois plus forte que toutes ses voisines, la variance sera faible. Si en revanche elle est deux fois plus forte que la majorité de ses voisines mais deux fois pus faible qu’une partie d’entre elles, alors la variance sera forte.
- la variables Z.Ii est une mesure standardisée du coefficient d’autocorrélation qui permet de savoir rapidement si l’autocorrélation locale est significativement différente de zéro. D’une manière générale, l’autocorrélation est significative au seuil de 0.05 si cette valeur z est supérieure à +1.96 ou inférieure à -1.96.
- la variable Pr(z>0) exprime la même chose en fournissant la p-value du test d’autocorrélation spatiale locale. On ne dispose plus du signe mais pn peut repérér directement toutes les provinces qui ont une autocorrélation spatiale significative (que celle-ci soit positive ou négative), à condition d’avoir bien pris la précaution de procéder à untest d’autocorrélation spatiale bilatéral à l’aide du paramètre alternative = “two.sided”. Si on oublie ce paramètre, la probabilité sera celle d’avoir une autocorrélation spatiale positive uniquement.
Typologie de Moran
L’ultime étape va consister à cartogaphier les provinces ayant un indice d’autocorrélation spatiale locale significativement différent de zéro en se fixant un seuil de significativité qui sera classiquement égal à 0.05 mais que l’on peut si on le souhaite rendre plus exigeant (0.01) ou moins exigeant (0.10). Dans notre exemple une seule région possède un indice local de Moran significatif, la région Ile de France qui est significativement dans le type Bas-Haut :